Nature | 强化学习提升DeepSeek推理能力
梁文锋等介绍如何结合强化学习(RL)[1]提升模型推理能力,把DeepSeek-V3 Base[2]升级到DeepSeek-R1的工作近日发表在Nature[3]。
推理 et deepseek 文锋 deepseek推理 2025-09-21 02:00 10
梁文锋等介绍如何结合强化学习(RL)[1]提升模型推理能力,把DeepSeek-V3 Base[2]升级到DeepSeek-R1的工作近日发表在Nature[3]。
推理 et deepseek 文锋 deepseek推理 2025-09-21 02:00 10
9月中旬,《自然》杂志封面论文让全球科技圈炸开了锅——中国AI公司DeepSeek的创始人梁文峰团队,用29.4万美元的训练成本,做出了性能媲美OpenAI数亿美元模型的AI系统。
马斯克 deepseek 文锋 deepseek评价 文锋d 2025-09-20 21:33 9
在国家自然科学基金项目资助下,北京大学计算机学院张铭教授团队与DeepSeek梁文锋团队合作,在长上下文大语言模型高效建模领域取得突破性进展,相关成果以“Native Sparse Attention: Hardware-Aligned and Nativel
相较于早期的 arXiv 预印版本,此次在 Nature 上发表的版本包含了更丰富的实现细节与更详尽的实验分析。我们相信,这些新增内容将为社区更好地理解和构建先进推理模型提供有效的经验。在过去的一年里,我们有幸见证并参与了 AI 推理模型的飞速发展。未来,我们
论文 高中生 deepseek 文锋 deepseek刷屏 2025-09-19 11:28 9
由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏
他“严厉的产品经理人设”也渗透在短短的半个小时里——他详细讲解面条的横截面、做法,甚至纠正一旁的同事要露出“甲方的logo”。
DeepSeek荣登Nature封面,实至名归!今年1月,梁文锋带队R1新作,开创了AI推理新范式——纯粹RL就能激发LLM无限推理能力。Nature还特发一篇评论文章,对其大加赞赏。
当AI模型的发布会变成科技圈的“脱口秀”,当“突破”“颠覆”成为行业话术的口头禅,一个中国团队带着他们的大语言模型走进了全球最顶级的学术殿堂。9月18日,《自然》杂志用整版封面宣告:DeepSeek-R1——首个接受严格同行评审的大语言模型来了。这不是一场技术
由梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《Nature(自然)》的封面。
9月17日,以梁文锋为通讯作者、DeepSeek团队共同发布,DeepSeek-R1推理模型研究论文——《DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning》。
由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏
罗永浩在某次AI项目测试中遇到了技术瓶颈。经过朋友介绍,他见到了大模型创业者梁文锋。两人谈话中,梁文锋问了他一句话:“你为什么非要做科技?”这句简单的话,说中了一个老问题,也成了一个新起点。
DeepSeek再次引发关注。9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文,登上了国际权威期刊《自然》的封面。该杂志直言:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”
2025年9月,一场与西贝的舆论交锋让罗永浩的直播间3天内吸引1200万人次观看,预估带货5000万元,公司股价两个交易日上涨超12%,而同一时期,他创办的细红线科技仅保留20多名软件工程师,与巅峰时150人的规模相去甚远。
不少人看完直呼“老罗这是真回来了”,但很少有人知道,这场爆发背后,藏着梁文锋对罗永浩的一句灵魂拷问:“你为什么非要做科技?”
与此同时,DeepSeek-R1正式成为全球首个经同行评审的大语言模型。《Nature》高度评价,“经过严格的同行评审流程无疑有助于验证模型的有效性和实用性,几乎所有大模型都没有经过独立同行评审,DeepSeek打破了这一空白。”
凌晨鲍威尔宣布降息25个点,符合市场预期,因为前面资金已经打过提前量,所以降息靴子落地后,全球市场反馈平淡。
据第一财经,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发
9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。
数月前,梁文锋得知罗永浩准备做AIOS(人工智能操作系统)时,他问罗永浩,“你为什么非要做科技?”在梁文锋看来,一个人如果能在任何领域做到全国前几名,就不应该辜负这份天分。而罗永浩,正是他眼中那个“最该靠嘴吃饭”的人。